Wav2vec2 Large Xlsr 53 Hungarian
Apache-2.0
基于facebook/wav2vec2-large-xlsr-53在匈牙利语Common Voice数据集上微调的自动语音识别模型
语音识别
Transformers

其他
W
sarpba
17
1
Whisper Uz
Apache-2.0
基于OpenAI Whisper Medium模型微调的乌兹别克语自动语音识别模型
语音识别
Transformers

其他
W
mustafoyev202
110
1
Disper Small Salam
Apache-2.0
基于OpenAI Whisper-small微调的阿拉伯语语音识别模型
语音识别
Transformers

阿拉伯语
D
Duino
14
1
Whisper Medium Cv11 German Ct2
Apache-2.0
基于OpenAI的whisper-medium模型在Common Voice 11.0德语数据集上微调的自动语音识别模型
语音识别
Transformers

德语
W
mkenfenheuer
21
1
Whisper Uz
Apache-2.0
基于Whisper Base微调的乌兹别克语语音识别模型,在Common Voice数据集上训练
语音识别
Transformers

其他
W
jamshidahmadov
1,179
3
Whisper Small Uzbek
Apache-2.0
基于OpenAI Whisper-small微调的乌兹别克语自动语音识别模型,在Common Voice 17.0数据集上训练
语音识别
Transformers

其他
W
abduaziz
20
2
Whisper Large V3 Turbo Es
MIT
基于Whisper-large-v3-turbo微调的西班牙语语音识别模型,在Common Voice 17.0西班牙语数据集上词错误率降低至5.34%
语音识别
Transformers

西班牙语
W
adriszmar
52
4
Whisper Tiny Chinese
Apache-2.0
基于OpenAI Whisper Tiny模型在Common Voice 11.0中文数据集上微调的语音识别模型
语音识别
Transformers

中文
W
jethrowang
99
1
Whisper Large V3 Az
Apache-2.0
该模型是基于OpenAI的Whisper Large v3在阿塞拜疆语Common Voice 17.0数据集上微调的自动语音识别(ASR)模型,取得了1.195%的词错误率(WER)。
语音识别
Transformers

其他
W
nsalahaddinov
96
1
Whisper Large V3 Turkish Test1
Apache-2.0
基于OpenAI Whisper-large-v3模型在Common Voice 17.0土耳其语数据集上微调的语音识别模型
语音识别
Transformers

其他
W
erdiyalcin
21
3
Whisper Small Turkish V2
Apache-2.0
基于OpenAI Whisper-small模型在土耳其语Common Voice数据集上微调的语音识别模型
语音识别
Transformers

其他
W
atakanince
61
2
Training V2
Apache-2.0
基于OpenAI Whisper-base模型在Common Voice 11.0俄语数据集上微调的语音识别模型
语音识别
Transformers

其他
T
SofiaK
15
1
Speecht5 Finetuned Commonvoice Ru Translit
MIT
基于microsoft/speecht5_tts在Common Voice 13数据集上微调的俄语文本转语音模型
语音合成
Transformers

其他
S
voxxer
57
2
Speecht5 Finetuned Common Voice Be
MIT
基于Microsoft SpeechT5架构的白俄罗斯语文本转语音模型,在Common Voice数据集上微调
语音合成
Transformers

其他
S
KoRiF
27
0
Speecht5 Tts Common Voice Uk
MIT
基于Microsoft SpeechT5架构微调的乌克兰语文本转语音模型,使用Common Voice数据集训练
语音合成
Transformers

其他
S
ewigeki
47
3
Speecht5 Tts Common Voice 5 Sv
MIT
基于微软SpeechT5架构微调的瑞典语文本转语音模型,使用Common Voice数据集训练
语音合成
Transformers

其他
S
GreenCounsel
27
1
Whisper Medium Turkish 2
Apache-2.0
基于OpenAI Whisper Medium微调的土耳其语语音识别模型,在Common Voice 11.0数据集上训练
语音识别
Transformers

其他
W
emre
267
15
Whisper Large V2 Hungarian
Apache-2.0
基于OpenAI Whisper Large-V2模型在匈牙利语Common Voice数据集上微调的语音识别模型
语音识别
Transformers

其他
W
DrishtiSharma
21
1
Whisper Large V2 Serbian
Apache-2.0
这是基于OpenAI Whisper Large-V2模型在塞尔维亚语Common Voice 11.0数据集上微调的语音识别模型,词错误率为10.76%。
语音识别
Transformers

其他
W
DrishtiSharma
39
3
Whisper Large V2 Hausa
Apache-2.0
该模型是基于OpenAI的Whisper Large-V2在豪萨语语音识别任务上微调的版本,在Common Voice 11.0数据集上训练
语音识别
Transformers

其他
W
DrishtiSharma
44
5
Whisper Large V2 Slovenian
Apache-2.0
本模型是基于OpenAI的Whisper Large-V2模型在Common Voice 11.0斯洛文尼亚语数据集上微调的语音识别模型,词错误率为13.83%。
语音识别
Transformers

其他
W
DrishtiSharma
53
1
Whisper Large V2 Hindi 2.5k Steps
Apache-2.0
这是一个基于OpenAI Whisper Large V2模型微调的印地语自动语音识别(ASR)模型,在Common Voice 11.0数据集上训练,词错误率(WER)为10.05%。
语音识别
Transformers

其他
W
DrishtiSharma
52
2
Whisper Large V2 Bn
Apache-2.0
基于OpenAI Whisper Large-v2模型在孟加拉语语音数据集上微调的自动语音识别(ASR)模型
语音识别
Transformers

其他
W
anuragshas
319
6
Whisper Large V2 Ta
Apache-2.0
基于OpenAI Whisper Large-v2模型微调的泰米尔语自动语音识别(ASR)模型,在Common Voice 11.0泰米尔语测试集上达到8.45%的词错误率
语音识别
Transformers

其他
W
anuragshas
15
1
Whisper Large V2 Malayalam
Apache-2.0
这是基于OpenAI Whisper Large V2模型在马拉雅拉姆语语音识别任务上的微调版本,使用Common Voice 11.0数据集训练
语音识别
Transformers

其他
W
DrishtiSharma
23
4
Whisper Large Pt Cv11
Apache-2.0
基于OpenAI的Whisper-large-v2模型在葡萄牙语Common Voice 11数据集上微调的语音识别模型
语音识别
Transformers

其他
W
jonatasgrosman
155
13
Whisper Large V2 Hi V3
Apache-2.0
基于OpenAI Whisper Large-v2模型微调的印地语语音识别模型,在Common Voice 11.0印地语测试集上达到11.3%的词错误率
语音识别
Transformers

其他
W
anuragshas
21
1
Whisper Large V2 Punjabi
Apache-2.0
基于OpenAI Whisper-large-v2微调的旁遮普语自动语音识别模型,在Common Voice 11.0数据集上训练
语音识别
Transformers

其他
W
DrishtiSharma
27
1
Whisper Large V2 Vietnamese
Apache-2.0
该模型是基于OpenAI的Whisper Small架构,在Common Voice 11.0越南语数据集上微调的自动语音识别(ASR)模型
语音识别
Transformers

其他
W
DrishtiSharma
25
2
Whisper Large V2 Cantonese
Apache-2.0
基于OpenAI Whisper Large V2在粤语数据集上微调的自动语音识别模型,在测试集上达到6.7274%的字错误率
语音识别
Transformers

其他
W
simonl0909
131
12
Whisper Medium French
Apache-2.0
基于openai/whisper-medium在common_voice_11_0数据集上微调的法语语音识别模型,标准化WER达到11.1406,优于原版模型。
语音识别
Transformers

法语
W
pierreguillou
260
9
Exp W2v2t Sv Se R Wav2vec2 S418
Apache-2.0
基于facebook/wav2vec2-large-robust模型微调的瑞典语自动语音识别模型,支持16kHz采样率语音输入。
语音识别
Transformers

E
jonatasgrosman
32
0
Exp W2v2t Sv Se Vp Nl S842
Apache-2.0
这是一个基于facebook/wav2vec2-large-nl-voxpopuli模型微调的瑞典语自动语音识别模型,使用Common Voice 7.0 (sv-SE)数据集进行训练。
语音识别
Transformers

E
jonatasgrosman
16
0
Exp W2v2t Fr Xls R S250
Apache-2.0
基于facebook/wav2vec2-xls-r-300m模型,使用Common Voice 7.0法语数据集微调的自动语音识别模型
语音识别
Transformers

法语
E
jonatasgrosman
20
0
Exp W2v2t Fr Vp Fr S438
Apache-2.0
基于facebook/wav2vec2-large-fr-voxpopuli模型微调的法语自动语音识别模型,使用Common Voice 7.0法语数据集训练。
语音识别
Transformers

法语
E
jonatasgrosman
20
0
Exp W2v2t Fr Unispeech S42
Apache-2.0
基于microsoft/unispeech-large-1500h-cv模型,使用Common Voice 7.0(法语)数据集微调的语音识别模型
语音识别
Transformers

法语
E
jonatasgrosman
20
0
Exp W2v2t It Vp Fr S821
Apache-2.0
基于facebook/wav2vec2-large-fr-voxpopuli模型微调的意大利语自动语音识别模型,使用Common Voice 7.0意大利语数据集训练
语音识别
Transformers

其他
E
jonatasgrosman
27
0
Exp W2v2t It Vp 100k S449
Apache-2.0
基于facebook/wav2vec2-large-100k-voxpopuli模型微调的意大利语自动语音识别模型,使用Common Voice 7.0意大利语数据集训练。
语音识别
Transformers

其他
E
jonatasgrosman
17
0
Exp W2v2t Ja Vp It S544
Apache-2.0
基于facebook/wav2vec2-large-it-voxpopuli模型,使用Common Voice 7.0 (日语版)的训练集进行语音识别微调的日语自动语音识别模型。
语音识别
Transformers

日语
E
jonatasgrosman
18
0
Exp W2v2t Ja Unispeech Sat S884
Apache-2.0
基于microsoft/unispeech-sat-large模型微调的日语自动语音识别模型,使用Common Voice 7.0日语数据集训练。
语音识别
Transformers

日语
E
jonatasgrosman
19
0
- 1
- 2
- 3
精选推荐AI模型
Llama 3 Typhoon V1.5x 8b Instruct
专为泰语设计的80亿参数指令模型,性能媲美GPT-3.5-turbo,优化了应用场景、检索增强生成、受限生成和推理任务
大型语言模型
Transformers

支持多种语言
L
scb10x
3,269
16
Cadet Tiny
Openrail
Cadet-Tiny是一个基于SODA数据集训练的超小型对话模型,专为边缘设备推理设计,体积仅为Cosmo-3B模型的2%左右。
对话系统
Transformers

英语
C
ToddGoldfarb
2,691
6
Roberta Base Chinese Extractive Qa
基于RoBERTa架构的中文抽取式问答模型,适用于从给定文本中提取答案的任务。
问答系统
中文
R
uer
2,694
98
AIbase是一个专注于MCP服务的平台,为AI开发者提供高质量的模型上下文协议服务,助力AI应用开发。
简体中文